Day 9｜ClickHouse 系列：Primary Key、Sorting Key 與 Granule 索引運作原理解析

2025 iThome 鐵人賽

DAY 9

Software Development

ClickHouse 系列：從資料庫底層架構到軟體應用實踐系列第 9 篇

17th鐵人賽

Vic

2025-08-12 09:07:19

410 瀏覽

分享至

在 ClickHouse 的查詢加速機制中，除了 Partition Pruning 進行粗篩外，另一個細緻化資料範圍掃描的關鍵機制就是 Primary Key (主鍵索引)、Sorting Key (排序鍵) 與 Granule 索引 (粒度索引)。

Primary Key 是什麼？

在 ClickHouse 中，Primary Key 與傳統 OLTP 資料庫中的「唯一鍵 (Unique Constraint)」不同，它 不保證資料唯一性，也不會自動加索引樹 (如 B-Tree)。
ClickHouse 的 Primary Key 是用來 決定資料在磁碟中的物理排序方式 (Clustered Index)，它是 MergeTree 引擎搜尋資料的首要索引依據。

特點：

決定資料的排序邏輯，並在查詢時作為區塊篩選的依據。
與 Partition Key 互補，Partition 負責粗篩區塊，Primary Key 決定區塊內的排序與定位。
可由一或多個欄位組成（ORDER BY 子句指定）。

範例：

CREATE TABLE orders
(
    order_date Date,
    user_id UInt64,
    order_id UInt64,
    amount Float64
) ENGINE = MergeTree
PARTITION BY toYYYYMM(order_date)
ORDER BY (user_id, order_date);

這裡的 Primary Key 是 (user_id, order_date)，資料會依此排序寫入磁碟。

Sorting Key 是什麼？

Sorting Key = ORDER BY 子句指定的欄位組合。
在 ClickHouse，Sorting Key 就是 Primary Key，只是名稱層面上的不同（某些文件會混用這兩個詞）。
Sorting Key 決定了 Data Part 中資料的物理排序方式，並影響查詢範圍裁剪的效率。

小結：

名稱	說明
Primary Key	排序索引 (Clustered Index)，實際儲存時資料排序依據
Sorting Key	與 Primary Key 同義，但更偏向強調排序邏輯層級的用詞

Granule (粒度索引) 是什麼？

Granule 是 ClickHouse 將資料拆分為查詢時可裁剪最小單位的「資料區塊」。
一個 Granule 會包含數千筆資料 (預設為 8192 rows)，系統會為每個 Granule 儲存該範圍內的 Sorting Key 最小值與最大值 (min-max 索引)。

Granule 的查詢流程：

查詢時會根據 WHERE 條件比對 Granule 的 min-max 範圍。
若條件不在該 Granule 範圍內，則直接跳過讀取該 Granule。
這種跳過稱為 Primary Key 範圍裁剪 (Primary Key Indexing)。

Granule 的儲存結構：

Granule ≈ 8192 rows (預設，可調整)
一個 Data Part 會包含多個 Granule。
Primary Key 索引是針對 Granule 粒度儲存的 Sparse Index。

Primary Key 範圍裁剪範例

SELECT * FROM orders WHERE user_id = 123456 AND order_date >= '2025-08-01';

根據 Partition Key 判斷哪些 Partition 需要被讀取 (Partition Pruning)。
進入符合條件的 Partition，根據 Primary Key 索引比對 Granule 範圍：
- Granule 1：user_id = 123455 ~ 123455 → 跳過
- Granule 2：user_id = 123456 ~ 123456 → 讀取
- Granule 3：user_id = 123457 ~ 123458 → 跳過

這種裁剪動作是查詢能夠在 TB 級資料中僅掃描少量資料的關鍵。

Primary Key 與 Secondary Index 有何不同？

比較項目	Primary Key (範圍索引)	Secondary Index (Data Skipping Index)
運作方式	資料寫入時排序，查詢時透過 Granule 索引範圍裁剪	查詢時依欄位值範圍 (min-max / bloom filter) 決定是否讀取
查詢效率	查詢條件若符合排序欄位 → 裁剪效率極佳	可支援非排序欄位的查詢過濾，但效率不如 Primary Key
建立方式	透過 ORDER BY 設定，與 MergeTree 強耦合	需額外建立 (ALTER TABLE ADD INDEX...)
適用查詢	範圍查詢、序列查詢、依排序邏輯為主的查詢	高基數欄位查詢（如特定 tag、keyword）

Primary Key 設計策略

設計策略	適用場景
常查詢範圍條件放最前面	例如 user_id、device_id 若常作為 WHERE 條件，應放排序鍵首位
從高選擇性到低選擇性排序	user_id → event_date，讓 Granule 範圍更集中，裁剪更精準
避免將高變異但不查詢的欄位設為排序鍵	如 UUID、隨機 hash，排序無助於裁剪，只會造成合併成本上升
結合 Partition 與 Sorting Key 設計	Partition 粗裁剪、Primary Key 精裁剪，讓查詢僅需掃描極小範圍資料

Sparse Primary Index 運作原理

ClickHouse 的 Primary Key 並不是傳統資料庫的全索引（如 B-Tree），而是設計成「Sparse (稀疏) 索引」，它透過 Granule (粒度區塊) 來達到大規模資料快速篩選的效果。

運作方式：

每個 Granule 只記錄首筆資料的 Primary Key 值：例如預設 Granule 粒度為 8192 筆，索引只會紀錄每個 Granule 第一筆資料的主鍵值。
Sparse 索引非常精簡，能完全載入記憶體中，即使資料量達到數百億筆，索引仍僅需占用少量記憶體空間。
每個 MergeTree 的 Data Part 都有獨立 Primary Index，查詢時這些索引會分別比對以達到最佳裁剪效果。
查詢時，ClickHouse 根據 WHERE 條件與 Sparse Primary Index 比對 Granule 範圍：
- 條件範圍外的 Granule 會被直接跳過，不進行掃描。
- 條件範圍內的 Granule 才會被讀取進行後續篩選。

查詢加速效果：

這種 Sparse 索引結構，能讓查詢只需掃描必要的 Granule，大幅減少 I/O 與記憶體資源消耗，特別是在 TB 級資料量時能明顯感受到查詢延遲的降低。

如何檢查 Primary Index 是否生效？

ClickHouse 提供了幾個實用的指令來協助你查看索引運作狀況：

1. 查看索引內容：`mergeTreeIndex` table function

SELECT * FROM mergeTreeIndex('your_database.your_table', 'primary_key') LIMIT 10;

這可以幫助你看到每個 Granule 第一筆資料的 Primary Key 值，了解索引結構。

2. 使用 `EXPLAIN` 確認索引是否被裁剪：

EXPLAIN PLAN SELECT * FROM orders WHERE user_id = 123456;

若 WHERE 條件與 Primary Key 匹配良好，查詢計劃會顯示「Granule 範圍裁剪」步驟。
若條件不符 (如查詢非排序欄位)，則無法利用索引進行裁剪。

3. `system.parts` 觀察查詢裁剪統計：

SELECT partition, active, rows, bytes_on_disk
FROM system.parts
WHERE table = 'orders' AND active;

Granule 粒度調整與效能平衡

調整 Granule 粒度：

透過 index_granularity 設定：

CREATE TABLE t (...) ENGINE = MergeTree() ORDER BY ... SETTINGS index_granularity = 4096;

粒度越小，裁剪效率越高，但會增加索引大小與查詢時的 CPU 負擔。
粒度越大，索引資料少，CPU 開銷低，但裁剪不精確，I/O 負擔較大。

建議：

大部分場景用預設 8192 即可。
若查詢條件能精準對應到排序鍵且資料量大時，可考慮調小到 4096 或 2048。
若查詢為全表掃描或高聚合查詢為主，可將粒度放大提升查詢吞吐量。

Best Practice

Best Practice	說明
Primary Key 欄位數量建議 1~3 欄位	過多欄位會增加排序成本與合併負擔，減少裁剪效果
裁剪效率依賴查詢條件與排序鍵的吻合度	WHERE 條件若能對應到排序鍵首欄位，裁剪效果最佳
index_granularity 避免過度微調	除非有特殊需求，否則不建議大幅修改，預設 8192 通常是性能與資源平衡的最佳值
結合 Partition 設計分層裁剪查詢	Partition 負責粗裁剪，Primary Key 精裁剪，能讓 TB 級資料也只需秒級查詢
可配合 Secondary Index 提升非排序欄位查詢效率	如需查詢非 Primary Key 欄位 (如 tags)，可搭配 Bloom Filter Index 加速裁剪查詢

結語

Primary Key 與 Granule 索引是 ClickHouse 能在海量資料中做到毫秒級查詢的核心技術。透過合理設計 Sorting Key、調整粒度、結合 Partition Pruning，能讓資料掃描量降到最小，大幅提升查詢性能。

Day 8｜ClickHouse 系列：分區策略與 Partition Pruning 技術，如何加速大數據查詢

Day 10｜ClickHouse 系列：CollapsingMergeTree 與邏輯刪除

系列文

ClickHouse 系列：從資料庫底層架構到軟體應用實踐共 30 篇

RSS系列文訂閱系列文

11 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

ClickHouse 系列：從資料庫底層架構到軟體應用實踐系列 第 9 篇